10. Loi de probabilité discrète

Soit X une variable aléatoire discrète prenant ses valeurs de 0 à 5. On considère l’échantillon ci-dessous :

valeurs

0

1

2

3

4

5

effectifs

0

23

33

76

47

21

1) Il y a 200 valeurs. La moyenne des données groupées est donc :

m = (0 x 0 + 23 x 1 + 33 x 2 + 76 x 3 + 47 x 4 + 21 x 5 ) / 100

On trouve : m = 3

La variance est la moyenne (pondérée) des carrés moins le carré de la moyenne :

s2 = (0 x 02 + 23 x 12 + 33 x 22 + 76 x 32 + 47 x 42 + 21 x 52 ) / 100 – 32 = 1.58

m = 3

s2 = 1.58

On remarque qu’effectivement la valeur 0 n’est jamais observée. Supposons qu’il s’agisse de la loi uniforme sur {1,...,5}. La moyenne théorique et la variance théorique de cette loi sont :

m = (n + 1) / 2

s2 = (n2–1) / 12

On en déduit :

m = 3

s2 = 2

La moyenne observée m est égale à la moyenne théorique m. La variance observée s2 est nettement inférieure à la variance théorique s2. On peut penser que la loi uniforme sur {1,...,5} est possible malgré tout.

2) On suppose que la loi de X est la loi binomiale pour n = 5 . On cherche p de façon que la moyenne théorique m soit égale à la moyenne observée m :

n x p = 3

Þ

p = 3 / 5

La variance théorique est alors :

s2 = n x p x (1 – p) = 5 x 3/5 x 2/5 = 1.2

p = 0.6

m = 3

s2 = 1.2

La loi binomiale paraît vraisemblable autant que la loi uniforme.

 

3) On considère maintenant une v.a. Z prenant ses valeurs dans {1, 2, 3, 4, 5} dont la loi de probabilité est définie par p1, ..., p5 avec :

p2 = 2 p1

p3 = 4 p1

p4 = 2 p1

p5 = p1

On a :

p1 + p2 + p3 + p4 + p5 = p1 (1 + 2 + 4 + 2 + 1) = 10 p1

Cette somme doit être égale à 1. On en déduit :

p1 = 1/10

p2 = 2 /10

p3 = 4 /10

p4 = 2 /10

p5 = 1/10

La moyenne théorique est :

m =

p1 x 1 + p2 x 2 + p3 x 3 + p4 x 4 + p5 x 5

=

(1 + 2 x 2 + 4 x 3 + 2 x 4 + 1 x 5 ) /10

=

3

La variance théorique est :

s2 =

p1 x 12 + p2 x 22 + p3 x 32 + p4 x 42 + p5 x 52 – 32

=

(1 + 2 x 22 + 4 x 32 + 2 x 42 + 1 x 52 ) /10 – 9

=

102 / 10 –9

=

1.02

 

m = 3

 

s2 =1.02

5) Les moyennes théoriques des trois lois proposées sont égales à la moyenne observée. On peut donc retenir la loi dont la variance est la plus proche : c’est la loi binomiale.

Un autre critère consiste à comparer les probabilités théoriques aux proportions observées.

La table ci-dessous donne les probabilités théoriques des lois considérées et les proportions observées :

 

X

loi uniforme

loi binomiale

loi de Z

proportions observées

0

0

0.01024

0

0

1

0.2

0.07680

0.1

0.115

2

0.2

0.23040

0.2

0.165

3

0.2

0.34560

0.4

0.380

4

0.2

0.25920

0.2

0.235

5

0.2

0.07776

0.1

0.105

 

Pour comparer les lois théoriques à la répartition observée, on peut calculer la somme des carrés des différences :

loi uniforme – loi observée :

0.0511

loi binomiale – loi observée :

0.0084

loi de Z – loi observée :

0.0031

Suivant ce critère, c’est la loi de Z que l’on choisit. Nous donnons dans le chapitre 5 le critère statistique qu’il est préférable d’utiliser (le c2).